QuBLAST: Cuantización con Compresión por Bloques y Escalado de Activaciones Descubre QuBLAST, un framework que reduce el tamaño de LLMs hasta un 45% mediante cuantización por bloques y escalado de activaciones, sin perder rendimiento. 2026-06-04 · 3 min